Instruções:

Utilizando Dados do Instituto Nacional de Meteorologia (INMET), busque pelas informações de precipitação e temperatura para os estados federativos do Brasil (UF) e responda às seguintes questões:

Questão 1 - Quais as 5 estações meteorológicas que apresentaram maior precipitação acumulada do ano de 2020?

Questão 2 - E quais as 5 estações com menor precipitação acumulada de 2020?

Questão 3 - Plote um gráfico, um para cada estado, com a temperatura média mensal dos últimos 12 meses.

Questão 4 (Bônus): Análise exploratória livre do dataset. Fique à vontade para trazer aqui alguma análise que considere relevante - com base no dataset apresentado

Ao analisarmos as opções de API não há uma opção direta para a obter todos os dados de todas as estações. Sendo assim, iremos primeiro obter os dados das estações e depois iterar por estação para pegar todos os dados. Para mais informações do API do INMET só acessar esse link

Das informações disponíveis a que mais nos interessa seria o código da estação, para iteração na API. Então vamos isolá-la e fazer uma exploração básica para checar se a API se comportou como esperamos

O resultado acima demonstra que cada linha representa apenas uma estação, como esperado. Sendo assim, vamos gerar a lista para de iteração para obter os dados do ano de 2020 para todas as estações

Nos próximos passos irei começar a fazer as análises exploratórias para responder as questões 1 e 2

Questão 1 - Quais as 5 estações meteorológicas que apresentaram maior precipitação acumulada do ano de 2020?

Questão 2 - E quais as 5 estações com menor precipitação acumulada de 2020?

De acordo com o manual do API do INMET a coluna CHUVA é relativa a PRECIPITAÇÃO TOTAL, DIARIO (AUT) em mm

Ao vermos a lista de valores únicos de chuva podemos ver que há varios valores None, ou seja, por algum motivo a estação não registrou medição. Vale notar que também há o valor 0 nessa lista, então podemos assumir que o None seja algum erro da estação

Além disso podemos observar que a informação da lista está como strings, que deveram ser transformadas para realizarmos a análise

As estações acima seriam as que menos tiveram precipitação acumulada ao longo de 2020, como o resultado é 0 é interessante saber quais estações tiveram uma precipitação acumulada de 0, já que não haveria distinção entre elas

Como podemos ver, 66 estações não tiveram chuva ao longo de 2020. Abaixo podemos vizualizar as localizações dessas estações

O mapa acima chama atenção pelos diversos pontos espalhados, valendo a pena ver como os dados foram obtidos pois parece ser algo incomum

Optei por plotar apenas um gráfico interativo para cada estado, acredito que seja uma opção mais elegante do que plotar 27 gráficos diferentes para cada estado

Também podemos ter essa mesma representação em um mapa coroplético

Segue abaixo algumas análises exploratórias livres. Vou investigar qual a relação entre a temperatura média e a precipitação e também ver quais são os estados com maior amplitude térmica, ou seja, maior variação entre a temperatura mínima e máxima ao longo do ano

Acima, tanto pela tabela de correlação quanto pelos gráficos podemos ver que não ha uma correlação definida. A chuva é o que parece indicar algum tipo de correlação exponencial, mas tem uma quantidade expressiva de dados que aparentam não seguir essa tendência

Abaixo irei analisar um pouco sobre a amplitude térmica

Uma amplitude térmica de 42.9°C parece ser algo exagerado, vamos analisar essa situação

Ao explorarmos mais os dados relativos a amplitude térmica algumas coisas estranhas começam a aparecer. Por exemplo, uma amplitude térmica muito grande para a cidade de Bragança no pará que, de acordo com esse link possui temperaturas elevadas o ano inteiro

Além disso, foram apontadas 201 ocorrências de amplitude térmica negativa, e o DataFrame mostra que nesses casos a Temperatura mínima do dia excedeu a temperatura máxima. Sendo assim, vamos limpar esses números para continuar nossa análise

A título de acelerar a análise iremos colocar cortar as linhas onde a amplitude térmica seja negativa e onde ela seja maior que 20°C. Mas o caminho ideal seria pesquisar para ver qual o melhor número para usar nesse limite superior

Através do BoxPlot podemos ver como as amplitudes se distribuem por estado ao longo dos meses, além de podemos saber quais as datas que os outliers ocorreram passando o cursor sobre esses pontos

Usando o cluster map podemos ver, por exemplo, que nos meses de Agosto a Outubro, na região dos estados de Tocantins, Goiás e Mato-Grosso, apresentam a maior amplitude térmica média